#decodificación de tokens

FOCUS: Los DLLMs saben cómo domar su límite de cómputo

Descubre cómo FOCUS optimiza la inferencia de DLLMs, enfocando el cómputo en tokens decodables para lograr hasta 3.5x más rendimiento sin pérdida de calidad.

2026-06-11 · 2 min